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摘 要 研究 通过 在 纵向 诊断 数据 分 析 中 引入 计算 简单 、 耗 时 少 的 汉 明 距离 判别 法 (HDD)， 提 出 了 纵向 


HDD (Long-HDD). 5 HDD 相 比 ，Long-HDD 额外 使 用 汉 明 距离 为 
的 相依 性 ， 


分 析 纵 向 诊断 数据 时 ， 与 参数 化 模型 相 比 ，Long-HDD 的 分 类 准确 性 几乎 不 受 样本 量 影响 ， 在 样本 量 


以 利用 前 一 时 间 点 信息 提高 当前 时 间 点 的 分 类 准确 性 。 三 个 模拟 研究 的 结果 主要 表明 : 在 


画 个 体 在 相 邻 时 间 点 上 对 属性 掌握 


一 


较 小 时 表现 更 优 ， 且 其 计算 耗 时 更 少 ， 更 有 利于 提供 及 时 性 诊断 反馈 。 实 证 研究 结果 表明 Long-HDD 


可 月 


日 于 分 析 实 践 测 评 数据 ， 且 其 追踪 诊断 结果 与 参数 化 模型 的 存在 一 致 性 。 


关键 词 “ 认 知 诊断 ， 非 参数 分 类 法 ， 纵 向 数据 分 析 ; 汉 明 距离 
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引言 


追踪 学 生 知识 和 技能 的 变化 ， 不 仅 有 利于 评估 教学 方法 的 有 效 性 ， 还 可 以 绘 第 


有 利于 优化 教学 过 程 和 实施 补救 教学 ( 往 济 


Hy 


HIASE, 2021)。 对 学 生发 展 轨迹 的 追踪 依赖 于 多 次 测量 所 收集 
的 纵 癌 数据 。 近 年 来 ， 纵 向 认 知 /学 习 诊 断 ， 即 评估 学 生 的 潜在 属性 (如 ,知识 和 技能 ) 并 确定 其 在 一 个 
[期 内 优势 与 不 足 ， 逐 渐 受 到 研究 者 和 教育 者 的 关注 (e.g., Zhan, 2020b; EXA, 2020)。 学 者 们 提出 


上 出 学 生 的 发 展 轨迹 ， 


了 不 同 的 纵向 诊断 分 类 模型 [diagnostic classification models，DCMSs) 为 纵 问 诊断 数据 分 析 提 供 方法 支持 


(JL Zhan, 2020b; 詹 沛 达 等 , 2021)， 如 ， 基 于 高 阶 潜 在 结构 模型 的 纵向 DCM 和 基于 潜在 转换 分 析 的 纵 


向 DCM。 这 些 研究 结果 表明 ， 参 数 化 纵向 DCMs 可 以 有 效 诊 断 学 生 个 体 或 群体 的 学 习 成 长 轨迹 。 
然而 , 参数 化 模型 的 实际 应 用 可 能 会 遇 到 一 些 障碍 , 特别 是 在 纵向 诊断 最 适用 的 小 规模 教育 测评 (如 ， 
班级 或 学 校 水平 的 测评 ) 中 。 例 如 ， 专 家 判定 的 认 知 假设 (如 ,连接 或 分 离 缩 合 规则 ) 与 学 生 实 际 应 用 的 
存在 偏差 ， 进 而 选用 了 基于 错误 认 知 假设 的 DCM; 需要 大 样本 以 保证 参数 估计 和 结果 分 类 的 准确 性 
(Chiu & Köhn, 2015); 在 应 用 相对 复杂 的 模型 时 ， 


型 


分 析 人 员 也 需要 一 定 的 编程 能 力 。 此 外 ， 参 数 化 模 


通常 需要 较 多 的 计算 时 间 ， 特 别 是 对 于 一 些 使 用 


马尔 科 夫 链 蒙 特 卡 洛 (MCMC) 算 法 的 纵向 DCMs。 


这 些 障碍 无 颖 提高 了 一 线 教育 工作 者 应 用 参数 化 模型 的 难度 ， 不 利于 其 在 实践 教学 环境 中 的 应 用 和 推 
广 。 


”本 研究 得 到 浙江 省 哲学 社会 科学 规划 “之 江青 年 理论 与 调研 专项 课题 "22JQN38YB) 和 教育 部 人 文 社会 科学 青年 基金 项 
目 (19YJC190025) 资 助 。 
”通讯 作者 : 詹 沛 达 , E-mail: pdzhan@gmail.com 
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为 避免 上 述 问题 ， 研 究 者 们 提出 了 一 些 非 参 数 分 类 (nonparametric classification, NPC) iX(Chiu, 
Douglas, et al., 2009; Chiu & Douglas, 2013; Chiu, et al., 2018; Wang & Douglas, 2015; 康 春花 等 , 2019)。 
与 参数 化 DCM 相 比 ，NPC 法 因 不 需要 进行 参数 估计 ， 所 以 它 对 样本 量 没 有 明确 要 求 ; 即 NPC 法 的 应 
用 摆脱 了 对 大 样本 量 的 依赖 ， 即 使 样本 量 为 1 也 可 以 使 用 。 此 外 ，NPC 法 不 需要 考虑 参数 化 模型 可 能 
存在 的 参数 估计 不 收敛 问题 ， 并 且 在 各 种 认 知 假设 下 均 有 良好 的 表现 (Chiu & Douglas, 2013; Wang & 
Douglas, 2015; Chiu et al., 2018; Akbay, 2016)。 同 时 ， 由 于 NPC 法 计算 简单 ， 其 对 应 用 者 的 编程 水 平 要 
求 相对 较 低 ， 并 且 可 以 实现 对 被 试 的 快速 分 类 ， 便 于 提供 及 时 性 诊断 反馈 。 

然而 ， 目 前 尚未 有 研究 试图 使 用 NPC 法 来 分 析 纵 向 认 知 诊断 数据 ， 即 NPC 法 在 追踪 学 生发 展 
方面 的 心理 测量 学 表现 还 不 明晰 。 随 着 “为 学 习 而 测评 ”理念 的 普及 (篇 沛 达 等 , 2021)， 考 虑 到 实践 
教学 对 纵向 认 知 诊断 的 需求 以 及 NPC 法 的 简便 性 ， 将 两 者 结合 并 探究 NPC 法 在 追踪 学 生发 展 方面 
的 心理 测量 学 表现 是 值得 尝试 的 。 为 此 ， 本 研究 的 主要 目的 是 提出 一 种 纵向 NPC 法 ， 以 期 实现 对 
个 体 属 性 掌握 情况 变化 的 追踪 。 
首先 ， 回 顾 两 种 相关 方法 : 一 个 是 有 代表 性 的 参数 化 纵向 DCM 一 一 纵向 高 阶 DINA (Long-DINA) 
模型 (Zhan, Jiao, Liao, & Li, 2019); 男 一 个 是 应 用 于 横断 诊断 数据 的 汉 明 距离 判别 法 (Hamming distance 
discrimination, HDD) (Chiu & Douglas, 2013)。 其 次 ， 介 绍 了 拟 提 出 的 纵 癌 NPC 法 一 一 纵向 HDD 
(longitudinal HDD, Long-HDD)。 接 着 通过 模拟 研究 评估 新 方法 在 纵向 诊断 测评 数据 分 析 中 的 表现 ， 并 
与 横断 HDD 和 Long-DINA 模型 进行 对 比 研究 。 然 后 ， 以 一 则 实证 数据 分 析 为 例 呈 现 新 方法 的 实践 可 
应 用 性 。 最 后 ， 总 结 该 研究 的 一 些 发 现 并 讨论 未 来 研究 方向 。 
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2 相关 方法 简介 
2.1 Long-DINA 模型 

已 有 研究 表明 ，Long-DINA 模型 在 纵向 认 知 诊断 数据 分 析 中 具有 良好 的 心理 测量 学 表现 (Zhan， 
2020b; Zhan, Jiao, Liao, & Li, 2019)。 该 模型 可 表示 为 ; 


一 阶 : 
K ' 

P(y,, 71|8,,8,,5,) = Bin * (17 Bi, -s| T ux , (1) 

二 阶 : 

exp(p,0,, 一 0， 
P(a,, -118,,B,9,) = ee Q) 
| exp(p,0,, —6,) 
三 阶 

0, =(0 ,07r) ~ MVN, (p, X), (3) 


A Cw N rn 


其 中 , gi sa 分别 表示 时 间 点 上 上 题目 上 上 的 猜测 和 失误 参数 ; ov = (nie …, Qng) 表 示 时 间 点 1 上 被 试 n 
的 属性 掌握 向 量 ，onu E{0, 1); gz 表示 时 间 点 上 上 题目 是 否 考查 属性 龙 gin €{0, 1}; On 为 时 间 点 + 上 
被 试 n 的 高 阶 能 力 ; Br 和 64 分 别 表示 所 有 时 间 点 上 属性 的 斜率 和 难度 参数 ，h = (u, .…, nm) 为 多 元 正 
态 分 布 的 均值 向 量 ，Zz 是 该 分 布下 的 协 方差 矩阵 ， 


L=: c. (4) 
EE - 
其 中 617 表 示 时 间 点 1 的 和 时 间 点 了 的 高 阶 能 力 之 间 的 协 方差 。 另 外 ， 作 为 纵向 测验 的 起 点 及 后 续 时 间 
点 的 参考 点 ，0m 被 约束 为 服从 标准 正 态 分 布 。 


2.2 HDD 法 

如 未 明确 说 明 ， 文 中 “HDD” 仅 指 代 横 断 HDD. HDD 是 一 种 易于 理解 且 常 见 的 NPC 法 ， 它 比较 
观察 作答 向 量 (ORP) 和 理想 作答 向 量 (IRP) 之 间 的 汉 明 距离 。 其 中 , 汉 明 距离 是 两 个 相同 长 度 的 向 量 在 相 
应 位 置 上 不 同 元 素 的 个 数 : 


dij, (A, B) = Xi-ilAi — Bil, (5) 
其 中 | 4;- Bi| 21 表示 向 量 A 中 第 i 个 元 素 与 向 量 B 中 的 第 i 个 元 素 不 相等 , 反之 | 4;- B;| 70 则 表示 相等 。 
例如 ，(1,1,0,1) 和 (1,0,0,1) 之 间 的 汉 明 距离 为 1。 
HDD 使 用 与 ORP 距离 最 近 的 IRP 所 对 应 的 属性 向 量 作为 学 生 的 属性 掌握 向 量 (AMP) (Chiu & 
Douglas, 2013; 罗 照 盛 等 , 2015) HDD F, 4: n 的 ORP 与 第 c (c=1, 2, ..., 29) IRP 之 间 的 汉 明 距离 
可 以 表示 为 : 


dnm (ORB, IRP;) = Diesl¥ni — yiil, (6) 
其 中 ，ywi 表 示 学 生 n 在 题目 i 上 的 作答 结果 ,yc 为 第 c 个 IRP 的 第 i 个 元 素 。 当 仅 有 一 个 IRP 5; ORP 
的 距离 最 短 时 , 与 这 个 IRP 所 对 应 的 属性 向 量 则 被 视 为 该 学 生 的 AMP; 而 当 有 多 个 IRP 与 ORP 的 距离 
最 短 时 ， 则 可 以 通过 及 方法 (随机 抽取 法 )、B 方法 ( 贝 叶 斯 方法 ) 和 W 方法 (加 权 汉 明 距 离 法 )( 对 应 图 1 
中 的 矩形 虚线 部 分 )， 筛 选 出 其 认为 最 有 可 能 的 AMP (Chiu & Douglas, 2013; 罗 照 盛 等 ，2105; REE 
等 ，2017)。 
需要 注意 的 是 HDD 也 可 用 于 分 析 纵 向 诊断 数据 ， 这 与 使 用 横断 参数 模型 分 析 纵 向 诊断 数据 的 做 法 
类 似 (Zhan, 2020a)。 有 具体 而 言 , 使 用 HDD 分 析 纵向 诊断 数据 时 ， 有 两 种 计算 策略 : 一 种 是 重复 使 用 HDD 
分 别 分 析 不 同时 间 点 的 数据 ( 即 独立 计算 策略 的 HDD， 记 为 HDD-D)， 另 一 种 是 将 所 有 时 间 点 数据 整合 
为 一 个 数据 并 使 用 HDD 进行 一 次 性 分 析 ( 即 同时 性 计算 策略 的 HDD， 记 为 HDD-T)。 理 论 上 两 种 计算 


1 由 于 有 研究 表明 该 三 种 方法 在 大 多 数 情况 下 的 判 准 率 几 乎 无 差异 ， 因 此 ， 不 在 此 做 详细 介绍 ， 仅 选用 简明 的 及 方法 ( 随 
机 抽取 法 ) 来 处 理 “ 一 对 多 ”的 情况 ， 详 情 可 查阅 康 春花 等 (2017)。 


3 


1 ”策略 的 结果 相同 ; 基于 模拟 研究 的 数据 分 析 结果 也 表明 两 者 的 表现 几乎 一 样 且 HDD-D 的 计算 耗 时 更 少 
2 “理论 说 明 及 数据 分 析 结 果 见 附录 ) 。 为 精简 ， 下 文 仅 使 用 HDD-D。 

3 

4 3 Long-HDD 方法 的 提出 

5 通常 ， 纵 向 研究 中 ， 在 不 同时 间 点 上 指 代 同一 潜在 特质 的 多 个 潜在 变量 (如 , 公式 2 中 指 代 同 一 潜 
6 在 特质 一 一 高 阶 能 力 一 一 的 多 个 潜在 变量 9) 之 间 是 高 相关 的 。 在 Long-DINA 中 , 这 种 相关 性 可 由 多 元 
7 ” 正 态 分 布 来 表示 ( 见 公 式 3)。 同 样 ， 在 NPC 法 中 ， 如 何在 不 涉及 模型 参数 的 情况 下 ， 处 理 相 邻 时 间 点 间 
8 AMP 的 相关 性 是 一 个 或 需 解决 的 问题 。 

9 在 对 虚拟 测评 过 程 性 数据 的 分 析 中 ( 刘 兽 辉 等 ,2022)， 有 研究 者 使 用 了 距离 判别 的 方法 来 处 理 不 同 


10 ”行为 序列 之 间 的 关联 性 ， 如 汉 明 距离 (Bergner et al., 2014) 和 编辑 距离 (Hao et al., 2015)。 在 解决 问题 时 ， 
11 ”不 同 个 体 的 动作 序列 之 间距 离 越 近 ， 表 明 他 们 的 动作 序列 越 一 致 、 解 决 问题 能 力 越 接 近 。 换 句 话说 , Bh 
12 _ 作 序列 之 间距 离 越 近 ,， 它们 之 间 相 关 性 就 越 高 ， 越 倾向 于 被 分 为 同一 类 。 受 此 启发 , 在 提出 的 纵向 NPC 
13 JAH, 汉 明 距离 将 被 再 次 用 来 表示 同一 学 生 在 不 同时 间 点 上 AMP 之 间 的 关联 性 。 本 研究 假设 同一 学 生 
14 ”在 相 邻 时 间 点 上 的 AMP 是 高 度 相 关 的 ， 因 此 该 学 生 在 两 个 相 邻 时 间 点 上 AMP 之 间 的 汉 明 距离 也 应 是 
15 ”最 小 的 。 

16 Long-HDD 用 汉 明 距离 来 表示 同一 学 生 相 邻 时 间 点 上 对 属性 掌握 情况 的 相关 性 或 依赖 性 ， 以 利用 前 
17 ”一 个 时 间 点 的 信息 来 提高 当前 时 间 点 的 分 类 精度 。Long-HDD 中 ， 同 一 学 生 相 邻 时 间 点 上 AMP 之 间 的 
18 ”相关 性 或 依赖 性 可 表示 为 : 

19 dpm(AMPne, One(e41)) = Le=1|%nke — oorcer nl, (7) 
20 ”其 中 , AMP 为 被 试 半 在 时 间 点 上 上 的 AMP, a seo 为 时 间 点 ttl1 上 与 学 生 n 的 ORP 具有 最 小 汉 明 距离 
21 ”的 IRP 集 合 所 对 应 的 属性 模式 集合 中 的 第 c 个 属性 向 量 ，Qwcrwrr) 则 为 该 第 c 个 属性 向 量 中 的 第 个 属 
22 ”性 的 状态 (0 或 1)。oww 为 时 间 点 1 上 学 生 n 对 属性 的 掌握 状态 (即时 间 点 + 上 学 生 n 的 AMP 中 的 第 
23 MEIE). 

24 如 图 1 所 示 ， 在 某 一 特定 的 时 间 点 内 ，Long-HDD 与 HDD 在 计算 方式 上 是 一 致 的 。 两 者 的 主要 区 
25 ” 别 是 在 判断 学 生 n 在 时 间 点 2 的 AMP ( 即 AMPw) 时 ， 须 额外 计算 IRP 集合 2 中 每 个 IRP 所 对 应 的 属性 
26 ” 癌 量 与 该 学 生 在 时 间 点 1 的 AMP (BI AMP1) 之 间 的 汉 明 距离 ( 见 公 式 7); 然后 使 具有 最 小 汉 明 距离 的 属 
27 ”性 向 量 作 为 该 学 生 时 间 点 2 上 的 AMP?”。 总 的 来 说 ,该 方法 通过 多 次 使 用 汉 明 距离 来 联接 学 生 在 相 邻 时 
28 HAE AMP 之 间 的 关联 性 。 当 7= 1 或 在 时 间 点 1 上 ，Long-HDD 等 同 于 HDD. 


= 
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? 理论 上 ， 在 比较 AMPn 和 时 间 2 中 的 “对 应 属性 模式 2 的 汉 明 距离 时 ， 仍 有 可 能 出 现 “一 对 多 ”的 情况 。 因 考虑 到 出 下 
该 种 情况 的 概率 比较 小 ， 本 文 并 未 对 该 过 程 中 可 能 出 现 “ 一 对 多 ”的 情况 进行 进一步 探究 。 本 文中 的 处 理 方式 为 : 不 管 是 
否 会 在 该 次 汉 明 距离 比较 中 出 现 “一 对 多 ”的 情况 ， 依 然 采 用 随机 的 方式 。 也 就 是 说 ， 从 该 次 汉 明 距 离 比较 得 出 的 结果 (与 
AMPmi 的 汉 明 距离 最 短 的 属性 模式 ) 中 随机 出 一 个 作为 AMPn2( 如 果 该 汉 明 距离 比较 的 结果 中 只 有 一 个 属性 模式 与 
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图 1 Long-HDD 应 用 流程 图 . 


本 文 开 展 三 个 模拟 研究 来 探究 Long-HDD 在 纵向 诊断 数据 分 析 中 的 表现 ， 即 探究 在 追踪 学 生发 展 


时 它 是 否 能 提供 准确 的 分 类 结果 ; 并 且 比 较 Long-HDD. HDD 和 Long-DINA 模型 的 分 类 准确 性 。 


4l 模拟 研究 1 
4.1.1 


研究 设计 及 数据 生成 


本 部 分 研究 包含 5 个 自 变 量 : (1) 考 虑 到 NPC 法 的 适用 情境 , 本 研究 侧重 于 小 规模 测评 , 样本 量 N= 
25、50、100 $1300; (2) 每 个 时 间 点 上 的 题目 数量 T= 25 和 50; (3) 每 个 时 间 点 上 所 考查 的 属性 数量 K = 
3 和 5; (4) 测 试 时 间 点 数量 7=2 和 3; (5) 数 据 分 析 方 法 M=Long-HDD、HDD 和 Long-DINA。 


AMPn 距离 最 小 ， 则 该 


属性 模式 则 为 AMPn;) 


在 每 个 时 间 点 Q 矩阵 中 ， 将 构成 可 达 / 单 位 矩阵 的 前 XEUSLE ee ZU TUS, ECE TAIN [8] ex DE AI 
变 (Zhan, Jiao, Liao, & Li, 2019)。 除 锚 题 外 ， 其 他 题目 所 考察 的 属性 向 量 是 以 相同 概率 从 包含 >2 个 属性 
的 属性 向 量 中 随机 提取 。 考虑 到 实际 测验 中 , 题目 的 猜测 和 失误 概率 可 能 呈现 负 相 关 (Zhan, Jiao, Liao, & 
Bian, 2019)， 在 每 个 时 间 点 上 题目 i 的 猜测 参数 gj 和 失误 参数 si 由 二 元 正 态 分 布 产生 : 

(oo) ve De EO 2)) e) 

该 设 定 下 所 有 题目 的 猜测 和 失误 概率 服从 正 偏 态 分 布 (平均 值守 0.1， 最 小 值守 0.01， 最 大 值守 0.6)。 各 时 
间 点 上 鳃 题 的 猜测 和 失误 概率 均 被 固定 为 0.1。 

为 保证 方法 之 间 对 比 的 公平 性 ， 本 研究 未 直接 采用 Long-HDD 或 Long-DINA 模型 作为 数据 生成 模 
型 。 被 试 的 属性 掌握 增长 按 如 下 方法 生成 : 在 第 一 个 时 间 点 ， 每 个 学 生 的 真实 AMP 是 以 相同 的 概率 从 
所 有 可 能 的 2* 个 属性 向 量 中 随机 抽取 ,在 随后 的 时 间 点 ,每 个 学 生 的 真实 AMP 的 生成 参考 了 Li 等 (2016) 
的 研究 。 具 体 而 言 ， 设 定 所 有 属性 的 相 邻 时 间 点 之 间 的 转移 概率 相等 : 


[ui 


P(0 > 0) = 0.8 
P(O > 1) = 0.2 

P(ankt 一 Ank(t+1)) = a > > = 0.05° e) 
P(1 1) = 0.95 


最 后 ， 根 据 生 成 的 真实 AMP、 题 目 参数 (异常 反应 概率 ) 和 Q ABE, SPICE I TR] P EFI DINA 
模型 生成 观察 数据 。 每 种 模拟 条 件 下 生成 50 批 数据 。 
4.1.2 分 析 

每 个 模拟 条 件 下 均 使 用 Long-HDD、HDD-D 和 Long-DINA 分 析 数 据 。 对 HDD-D 而 言 ， 重 复 使 用 
HDD 分 析 每 个 时 间 点 上 的 数据 。 对 Long-HDD 而 言 , 对 每 个 时 间 点 的 数据 逐一 进行 分 析 , 即 基于 HDD, 
结合 前 一 个 时 间 点 的 分 类 结果 ， 辅 以 判定 当前 时 间 点 上 学 生 的 AMP。 对 Long-DINA 模型 而 言 ， 采 用 同 
时 性 参数 估计 策略 (Zhan, 2020a)， 这 涉及 到 将 多 个 时 间 点 的 作答 数据 重新 整合 为 一 个 作答 矩阵 ， 然 后 将 
其 作为 一 个 整体 进行 分 析 。 使 用 MCMC 算法 实现 对 Long-DINA 模型 的 参数 估计 : 包含 两 条 链 ， 每 条 链 
采样 8,000 次 ,前 5,000 次 用 于 预 热 ; 根据 潜在 量 尺 缩减 因子 (PSRF)<1.1 的 标准 ， 待 估计 参数 均 已 收敛 。 
使 用 属性 向 量 正确 分 类 率 (PCCR) 和 纵向 PCCR (LPCCR) (Zhan, Jiao, Liao, & Li, 2019) 评 估 各 方法 的 


分 类 准确 性 : PCCR, = XE, DN, xn，LPCCR = YES Ya [vt às = oamt]/NR， 其 中 ， 开 ] 是 
一 个 指示 函数 ，N 是 样本 量 ，R 是 迭代 次 数 ，t 为 第 1 个 时 间 点 ，@nt 和 Qnt 分 别 表示 学 生 n 在 时 间 点 1 的 
估计 AMP 和 真实 AMP. 

4.1.3 结果 

图 2 呈现 了 三 种 方法 在 不 同 模拟 条 件 下 各 时 间 点 的 PCCR 和 LPCCR。 首先 , 与 已 有 研究 的 发 现 类 似 
(Chiu & Douglas, 2013; Zhan, Jiao, Liao, & Li, 2019; 康 春 花 等 , 2017), 随 着 所 测 属性 数量 的 增加 和 测验 时 
间 点 数量 的 增加 ， 三 种 方法 的 分 类 准确 性 均 有 所 下 降 。 相 比 之 下 ， 随 着 题目 数量 的 增加 ， 三 种 方法 的 分 
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类 准确 性 均 有 所 上 升 。 其 次 , 样本 量 对 HDD-D 和 Long-HDD 的 影响 较 小 。 且 在 所 有 条 件 下 ，Long-HDD 
的 分 类 准确 性 均 高 于 HDD-D 的 ， 表 明 在 分 析 纵向 数据 时 ， 考 虑 相 邻 时 间 点 AMP 之 间 的 相关 性 或 依赖 性 
是 必要 的 。 然 后 ， 当 Long-HDD 和 Long-DINA 进行 比较 式 时 ， 前 者 的 相对 优势 在 样本 量 较 小 的 时 候 更 
为 明显 ， 而 后 者 在 样本 量 增加 至 100 以 上 时 显示 出 与 前 者 匹配 的 分 类 准确 性 ， 且 后 者 的 相对 优势 随 样本 
量 的 继续 增加 而 增加 。 


42 ”模拟 研究 2 
4.2.1 研究 设计 、 数 据 生成 和 分 析 

研究 2 为 进一步 考察 在 小 样本 条 件 下 Long-HDD 在 不 同 大 小 的 属性 转移 概率 下 的 表现 。 更 高 的 属 
性 转移 概率 意味 着 有 更 大 比例 的 学 生 对 属性 的 掌握 状态 发 生变 化 。 本 研究 包含 4 自 变量 : (1) 同一 属性 
在 相 邻 时 刻 间 的 转移 概率 P(0 — 1) = 0.5 (中 等 水 平 ) 和 P(0 > 1) = 0.8 (高 水 平 )， 见 公式 (10); (2) 每 个 时 
间 点 上 的 题目 数量 7= 25 和 50; (3) 每 个 时 间 点 上 所 考查 的 属性 数量 K=3 和 5; (4) 数据 分 析 方 法 M = 
Long-HDD、HDD-D fil Long-DINA. 4b, T-3 和 N=25; Q 矩阵 和 题目 参数 的 设置 、 观 察 数据 的 生成 ， 
以 及 分 析 方 法 同 研究 一 保持 一 致 。 


P(0 > 0) = 0.5 
BAPE je oa | oat 
P(1 > 1) = 0.95 
P(0 > 0) = 0.2 
高 水 平 增长 : Planet > Onxce+1)) = | 7 F r 7 ae ` qo) 
P(12 1) = 0.95 
422 结果 
图 3 呈现 了 三 种 方法 在 不 同 模拟 条 件 下 的 PCCR 和 LPCCR。 结 果 表明 三 种 方法 的 判 准 率 的 相对 优 
劣 在 中 等 水 平 增长 和 高 水 平 增长 条 件 下 相对 稳定 ; 其中，Long-HDD 的 判 准 率 仍然 是 最 高 的 。 结 合 研究 
1 和 研究 2 的 结果 表明 ， 在 小 样本 条 件 下 ，Long-HDD 的 判 准 率 优 于 HDD-D 和 Long-DINA 的 ， 且 该 优 
势 几 乎 不 受 出 现 掌握 状态 变化 的 学 生 的 比例 的 影响 。 


43 ”模拟 研究 3 
4.3.1 研究 设计 、 数 据 生成 和 分 析 

本 研究 拟 在 小 样本 条 件 下 采用 Long-DINA 生成 数据 ， 此 时 ， 若 Long-HDD 的 表现 仍 优 于 或 不 输 于 
Long-DINA 的 ， 则 可 进一步 凸显 在 小 样本 测验 情境 下 使 用 Long-HDD 的 相对 优势 。 对 此 ， 本 研究 仪 包 
含 1 个 自 变 量 : 属性 数量 K=3 5; 并 将 样本 量 、 时 间 点 数 和 每 个 时 间 点 上 题目 数量 分 别 固 定 为 N=25、 
T=3 Fl 25, Q 矩阵 和 题目 参数 的 生成 方式 与 研究 1 保持 一 致 。 男 外 ， 参 照 詹 沛 达 等 人 (2021) 的 研究 ， 
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在 Long-DINA 二 阶 模型 〈 公 式 2) 中 ， 固 定 属性 难度 参数 B= (-1, -0.5, 0, 0.5, -1y', 属性 区 分 度 参 数 & 
固定 为 1.5; 在 三 阶 模型 (公式 3) 中 ， 相 邻 时 刻 间 一 般 潜在 能 力 6 的 均值 变化 设 定 为 0.5， 量 尺 变 化 ( 即 
标准 差 增加 的 倍数 ) 设 定 为 V1.25 。 作 管 结果 数据 依据 yas Bernoulli(POm = D) 生成 ， 其 中 PO = 1) 为 
公式 1。 分 析 方法 同 研究 1 保持 一 致 。 
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图 4 呈现 了 三 种 方法 在 不 同 模拟 条 件 下 的 PCCR 和 LPCCR. 结果 显 示 三 种 方法 的 判 准 率 差异 较 小 ; 
这 表明 即便 在 相对 不 公平 的 对 比 条 件 下 使 用 Long-DINA 模型 作为 数据 生成 模型 ) ，Long-HDD 方法 
也 能 提供 与 数据 生成 模型 相当 的 判 准 率 。 另 外 ， 三 种 方法 对 SO 组 数据 的 平均 计算 耗 时 和 排序 分 别 为 : 
K=3 时 Long-DINA (138.95 秒 ) > Long-HDD (0.11 秒 ) > HDD-D (0.07 秒 ); K=5 IN Long-DINA (174.78 
秒 ) > Long-HDD (0.44 秒 ) > HDD-D (0.29 秒 )。 显 然 ， 属 性 数量 会 影响 参数 估计 时 间 ; 另外 ， 非 参数 方 
法 的 计算 耗 时 要 远 小 于 参数 化 模型 的 ， 并 且 ， 由 于 Long-HDD 方法 针对 “一 对 多 ”的 情况 需要 额外 计 
算 汉 明 距离 ， 所 以 其 计算 耗 时 略 多 于 HDD-D。 表 1 呈现 了 50 组 数据 中 HDD-D 中 出 现 “一 对 多 ”的 比 
例 。 可 以 看 到 玉 = 3 时 各 时 间 点 中 “一 对 多 ”的 平均 比例 约 5% 左 右 ; K=5 时 各 时 间 点 中 “一 对 多 ”的 
平均 比例 约 10% 左 右 。 即 属性 数量 的 增加 会 导致 “一 对 多 ”比例 的 增加 。 但 需要 强调 的 是 HDD-D 中 出 
现 “ 一 对 多 ”的 比例 受 题目 参数 的 影响 〈 罗 照 盛 等 , 2015) ， 而 本 研究 中 题目 参数 的 生成 是 基于 二 元 正 
态 分 布 随机 生成 的 〈 即 无 法 固定 题目 参数 的 影响 》， 因 此 该 比例 结果 仅 供 参 考 。 

综 上 所 述 ， 模 拟 研究 结果 表明 (1)Long-HDD 在 纵向 诊断 数据 分 析 中 具有 较 高 的 分 类 准确 性 ; 
(2)Long-HDD 的 表现 几乎 不 受 样本 量 的 影响 ， 在 小 样本 情况 下 表现 优 于 Long-DINA; (3)Long-HDD 的 
表现 几乎 不 受 出 现 掌握 状态 变化 的 学 生 的 比例 的 影响 ，(4) 小 样本 条 件 下 ， 即 便 以 Long-DINA 作为 数 
据 生 成 模型 ， Long-HDD 的 表现 也 不 输 于 Long-DINA 的 ; 和 (5)Long-HDD 的 计算 耗 时 低 于 Long-DINA 
的 。 


=2 


(a) T 


1.0 


N=300 


N=100 


I-50 


N-50 


N-25 


K-5 


N-300 


N-100 


E25 


N=50 


=300 N=25 
t-2 e LPCCR 
(b) T=3 


N 
E PCCR t1 B PCCR 


N-100 


E-50 


N-50 


N-25 


K=; 


N=300 


N=100 


E25 


CAL5&8000 10cc0c:AIXEUIU3 


E25 


50 


E-25 


K-5 


3 


E PCCR 1 E PCCR t2 E PCCR t-3 。 LPCCR 
模拟 研究 1 中 Long-HDD, HDD-D 和 Long-DINA 的 分 类 准确 率 . 


图 2 


202201 .00037v2 


chinaXiv 


1.0 


S 


.9 


s 
E 


- 
u 


=] 
an 


S 
Un 


pi 


AMAL 


D A D A D A D A D A D A D A D A 
Pe bk gp dee Pin PE Re ERD RR EE gS 
poe foe Po foe foe foe foe Í 
E25 50 I-25 I-50 E25 E50 1-25 F50 
K-3 K-5 K-3 K-5 
p(0? 1)-0.5 p(0? 1)-0.8 
PCCR t1 E PCCR t2 B PCCR t-3 * LPCCR 
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图 4 模拟 研究 3 Long-HDD, HDD-D fil Long-DINA 的 分 类 准确 率 . 
表 1 模拟 研究 3 中 HDD-D 方法 中 不 同时 刻 出 现 “ 一 对 多 ”的 比例 . 
K “一 对 多 ”比例 t=1 t=2 =3 
3 最 大 值 0.16 0.20 0.12 
最 小 值 0.00 0.00 0.00 
平均 值 0.05 0.06 0.03 
5 最 大 值 0.24 0.28 0.20 
最 小 值 0.00 0.00 0.00 
平均 值 0.13 0.12 0.09 


注 : 最 大 值 、 最 小 值 和 平均 值 分 别 为 50 组 数据 中 的 最 大 、 最 小 和 平均 的 “比例 ”。 


5 实证 数据 分 析 
5.1 数据 说 明 


实证 数据 来 源 于 某 中 学 七 年 级 90 rei Qd dE & Zhan, 2021)。 为 避免 记忆 /练习 效应 ， 


该 纵向 测验 包括 三 套 测 试题 目 不 同 的 平行 测试 ; 


平行 测试 具有 相同 的 Q 和 矩阵 ( 见 图 5), 每 次 测试 包含 
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HDD-D #1 Long-DINA 模型 分 析 该 数据 , 并 计算 每 个 施 测 时 间 点 下 , 每 种 方法 下 学 生 在 不 同属 性 上 的 
掌握 占 比 ( 即 掌握 人 数 占 总 人 数 的 比例 )。 
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6 呈现 了 三 种 方法 下 六 个 属性 的 掌握 占 比 随 时 间 发 展 趋势 。 首 先 ， 整 体 而 言 ， 学 生 对 各 属性 
的 掌握 占 比 均 有 提升 ， 但 不 同属 性 有 不 同 的 变化 趋势 。 其 次 ， 不 同方 法 对 属性 变化 趋势 的 追踪 略 有 
差异 。 具体 而 言 , 对 属性 1、3 和 4, 三 种 方法 的 追踪 结果 较为 一 致 ; 而 对 于 属性 2、5 和 6, Long-HDD 
与 HDD-D 的 追踪 结果 更 一 致 ， 两 者 与 Long-DINA 模型 的 追踪 结果 存在 一 定 差异 。 另 外 ， 在 分 析 该 
实证 数据 时 ，HDD-D 方法 中 出 现 “ 一 对 多 ”的 比例 在 三 个 时 间 点 上 分 别 为 0.88，0.72 和 0.48; 而 
Long-HDD 方法 中 第 二 次 计算 最 小 汉 明 距离 时 出 现 “一 对 多 ”的 比例 为 0 和 0.11 (第 二 次 计算 最 小 汉 
明 距 离 对 应 图 1 中 比较 AMPz 和 “对 应 的 属性 掌握 模式 2” 的 汉 明 距离 )。 这 不 仅 表 明了 Long-HDD 
在 实际 的 数据 分 析 中 存在 很 大 的 应 用 空间 ， 而 且 也 说 明 再 次 使 用 最 小 汉 明 距离 可 以 有 效 缩小 ! (t >1) 
时 刻 学 生 可 能 的 AMP 范围 ， 获 得 较为 稳定 的 判 准 结果 。 但 遗憾 的 是 ， 由 于 非 参数 法 无 法 像 参 数 化 模 
型 一 样 提供 模型 -数据 拟 合 指标 值 ， 因 此 ， 我 们 并 无 法 对 比 三 种 方法 对 该 数据 的 拟 合 或 匹配 程度 。 总 
之 ， 实 证 研究 表明 Long-HDD 可 用 于 分 析 实 践 测评 数据 且 Long-HDD 的 追踪 诊断 结果 与 Long-DINA 


模型 的 存在 一 定 的 一 致 性 。 
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图 $ 有理数 测验 的 Q 矩阵 
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图 6 六 个 属性 的 掌握 占 比 随时 间 发 展 趋势. 

6 _ 讨论、 展望 与 研究 结论 
61 讨论 与 展望 

本 研究 通过 在 纵向 诊断 数据 分 析 中 引入 计算 简单 、 耗 时 少 的 HDD， 提 出 了 Long-HDD， 以 期 
促进 纵向 认 知 诊断 在 实践 教学 中 的 应 用 。 与 HDD 相 比 ，Long-HDD 使 用 汉 明 距离 刻画 个 体 在 相 邻 
时 间 点 上 对 属性 掌握 情况 的 相关 性 或 相依 性 ， 以 利用 前 一 个 时 间 点 的 信息 来 提高 当前 时 间 点 的 分 
类 准确 性 。 该 方法 不 仅 降低 了 纵向 诊断 数据 分 析 的 难度 ， 还 拓宽 了 NPC 法 的 应 用 范围 。 模 拟 研 究 
结果 主要 表明 Long-HDD 可 用 于 分 析 纵 向 诊断 数据 ， 也 能 刻画 学 生 的 潜在 属性 变化 ， 且 由 于 其 计 
算 简单 耗 时 少 ， 更 有 利于 实现 即时 性 诊断 反馈 ， 这 在 班级 和 学 校 层 面 的 小 规模 测评 中 尤为 重要 。 
实证 研究 表明 Long-HDD 可 用 于 分 析 实 践 测评 数据 且 其 追踪 诊断 结果 与 Long-DINA 模型 的 存在 一 
定 的 一 臻 性。 另外， 在 纵向 数据 的 分 析 中 ，Long-HDD 通过 多 次 汉 明 距离 的 比较 ， 可 获得 较为 稳 
定 的 判 准 结果 ， 相 对 于 采用 随机 化 方法 的 HDD 来 说 ， 有 更 高 的 诊断 分 类 一 致 性 。 

作为 一 种 非 参数 方法 ，Long-HDD 缺少 相关 的 数据 拟 合 指标 ， 即 无 法 评估 其 对 数据 的 拟 合 程 
度 。 实 际 上 ， 在 班级 水 平 小 规模 测评 中 ， 诊 断 结果 的 准确 性 并 不 是 实践 者 关注 的 首要 问题 。 即 便 
不 进行 诊断 性 测评 , 任课 教师 也 可 以 根据 学 生 的 原始 作答 来 推断 每 一 个 学 生 对 知识 点 的 掌握 情况 。 
从 该 角度 看 ， 基 于 方法 的 诊断 结果 更 多 地 是 为 了 降低 老师 工作 量 ， 为 一 对 一 有 针对 性 干预 提供 参 
考 性 建议 ;而 至 于 老师 是 否 要 依据 诊断 结果 为 学 生 提供 干预 ， 最 终 仍 由 老师 决定 。 反 之 ， 在 实践 
应 用 中 如 果 样 本 量 足 够 (如 ,大 于 300 人 ) 且 无 计算 耗 时 压力 , 仍 推荐 使 用 可 提供 模型 -数据 拟 合 程度 
的 参数 化 模型 。 
由 于 能 力 和 精力 有 限 , 本 文 仍 有 一 些 局 限 性 值得 后 续 做 进一步 探究 。 首先 , Long-HDD 是 HDD 
的 拓展 ， 因 此 ，HDD 的 理论 局 限 性 也 存在 于 Long-HDD 中 。 例 如 ， 本 文中 HDD 只 考虑 了 最 简单 
的 汉 明 距离 。 在 实践 中 , 不 同 的 属性 可 能 有 不 同 的 权重 ， 后 续 研究 中 可 以 考虑 将 加 权 HDD (Chiu & 
Douglas, 2013) 纳 入 Long-HDD 中 。 其 次 ， 本 研究 假设 属性 遵循 连接 缩合 规则 ， 即 学 生 只 有 在 掌握 
题目 所 考察 的 所 有 属性 时 ， 才 会 有 较 高 的 正确 作答 概率 。 而 这 一 假设 可 能 在 一 定 程度 上 制约 了 
Long-HDD 的 实践 应 用 。 未 来 ， 可 尝试 将 广义 NPC 法 (Chiu et al., 2018) 纳 入 Long-HDD 中 ， 以 提 
高 新 方法 在 不 同 认 知 假设 下 的 适用 性 。 然 后 ， 本 研究 中 每 个 属性 在 相 邻 时 间 点 之 间 的 转移 概率 被 
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设 定 为 相等 。 尽 管 作者 认为 该 设置 对 本 研究 的 结论 没有 影响 ， 但 Long-HDD 在 可 变 的 转移 概率 下 
的 具体 表现 仍 值得 进一步 探索 。 然 后 ， 理 论 上 Long-HDD 仅 在 时 间 点 tt >1) 的 IRP 集合 中 包含 多 
个 IRP 时 ( 即 存在 “一 对 多 ”) 才 起 作用 。 而 当 IRP 集合 中 只 有 一 个 IRP 时 ，Long-HDD 的 分 类 结果 
等 同 于 HDD 的 。Wang 和 Douglas (2015) 认 为 增加 题目 数量 会 减少 “一 对 多 ”情况 的 发 生 ， 然 而 ， 
本 研究 结果 发 现 , 即便 题目 数量 从 25 增加 到 50, 似乎 并 没有 减少 Long-HDD 相对 于 HDD 的 优势 。 
罗 照 盛 等 人 (2015) 探 完了 在 不 同属 性 层级 结构 和 作答 失误 概率 对 出 现 “ 一 对 多 ”的 影响 ; 其 研究 发 
现 随 着 作答 失误 概率 的 增加 ， 在 任 一 属性 层级 结构 中 会 出 现 更 多 的 “一 对 多 ”。 此 外 ， 康 春花 等 
人 (2017) 研 究 表明 Q 矩阵 中 所 含 可 达 和 矩阵 的 数量 也 会 影响 HDD 的 分 类 准确 性 。 因 此 ， 作 者 认为 除 
题目 数量 外 , “一 对 多 ”情况 的 发 生还 受到 Q 乞 阵 的 复杂 性 、 题 目 质量 及 属性 层级 等 因素 的 影响 ， 
而 具体 的 影响 程度 也 值得 后 续 做 进一步 探究 。 
62 ”研究 结论 

Long-HDD 在 纵向 诊断 数据 分 析 中 可 以 提供 较 高 的 分 类 精度 ， 且 由 于 不 受 样本 量 的 影响 、 计 
算 简单 、 耗 时 少 ， 其 相对 于 参数 化 纵向 DCM (如 , Long-DINA)， 更 有 利于 提供 即时 性 诊断 反馈 ， 
更 适用 于 如 班级 和 学 校 层面 的 小 规模 纵向 测评 。 
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Longitudinal Hamming Distance Discrimination: Developmental Tracking of Latent Attributes 
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Abstract 

Longitudinal cognitive diagnostics can assess students’ strengths and weaknesses over time, profile 
students’ developmental trajectories, and can be used to evaluate the effectiveness of teaching methods and 
optimize the teaching process. Researchers have proposed different longitudinal diagnostic classification 
models, which provide methodological support for the analysis of longitudinal cognitive diagnostic data. 
Although these parametric longitudinal cognitive diagnostic models can effectively assess students’ growth 
trajectories, their requirements for coding ability and sample size hinder their application among frontline 
educators, and they are time-consuming and not conducive to providing timely feedback. On the one hand, 
the nonparametric approach is easy to calculate, efficient to apply, and provides timely feedback; on the 
other hand, it is free from the dependence on sample size and is particularly suitable for analyzing 
assessment data at the classroom or school level. Therefore, this study attempts to apply nonparametric 
method to longitudinal cognitive diagnostic assessments for tracking student's learning trajectories. 

This study extended the longitudinal Hamming distance discriminant (Long-HDD) based on the 
Hamming distance discriminant (HDD), which uses the Hamming distance to represent the dependence 
between attribute mastery patterns of the same student at adjacent time points. To explore the performance 
of Long-HDD in longitudinal cognitive diagnostic data, we conducted three simulation studies and an 
empirical study and compared the classification accuracy of the HDD, Long-HDD, and Long-DINA 
models. The purpose of simulation study 1 was to compare the performance of performance of three 
methods under different simulation conditions. Simulation study 2 focused on the classification accuracy 
of the three methods at moderate attributes transfer probability level (p(0— 1)=0.5, p(1—0)-0.05) and high 
attributes transfer probability level (p(0— 1)=0.8, p(1—0)-0.05). To further highlight the advantages of the 
Long-HDD in small-scale assessments, the Long-DINA model was used as the data generation model in 
Study 3. At this point, if Long-HDD still outperforms or does not lose out to Long-DINA model's, the 
relative advantage of using Long-HDD in a small-scale assessments can be further highlighted. 
Furthermore, an empirical study was conducted to illustrate the application of the Long-HDD. 

Under the comparison of the three methods, the results of the simulation studies showed that (1) 
Long-HDD had higher classification accuracy in longitudinal diagnostic data analysis; (2) Long-HDD 
performed almost independently of sample size and performed better with a smaller sample size compared 
to Long-DINA; and (3) Long-HDD consumed much less computational time than Long-DINA. In addition, 


the results of the empirical study showed that there was good consistency between the results of the 


Long-HDD and the Long-DINA model in tracking changes in attribute development. The percentage of 
mastery of each attribute increased with the increase of time points. 

In summary, the long-HDD proposed in this study extends the application of nonparametric methods 
to longitudinal cognitive diagnostic data and can provide high classification accuracy. Compared with 
parameterized longitudinal DCM, it can provide timely diagnostic feedback due to the fact that it is not 
affected by sample size, simple calculation, and less time-consuming. It is more suitable for small-scale 
longitudinal assessments such as class and school level. 

Keywords: cognitive diagnosis; nonparametric classification; longitudinal data analysis; Hamming 
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附 录 

S1 两 种 计算 策略 HDD 结果 的 一 致 性 

入 设 有 两 个 时 间 点 ， 每 个 时 间 点 用 7 个 题目 测量 KK 个 属性 。 首 先 ， 解 释 一 些 下 文 会 用 到 的 缩 
写 : ORPI、ORP:、AMP1I、AMP:、IRP 集 、IRP 集合 1、IRP 集合 2 分 别 代表 学 生 在 时 间 点 1 的 观 
察 作 答 向 量 、 时 间 点 2 的 观察 作答 向 量 、 时 间 点 » 的 属性 掌握 向 量 、 时 间 点 2 下 的 属性 掌握 向 量 、 
筛选 出 的 与 ORP 距离 最 短 的 IRP 的 集合 、 在 时 间 点 1 与 ORP 距离 最 短 的 IRP 集合 和 在 时 间 点 2 
与 ORP: 距离 最 短 的 IRP 集合 。 
S1.1 采用 独立 计算 策略 的 HDD-D 

这 种 情况 下 ， 在 每 个 时 间 点 可 得 到 2* 个 IRP, 每 个 IRP 的 长 度 等 于 了。 通过 比较 每 个 时 间 点 的 
ORP 和 IRP 的 汉 明 距离 。 可 以 得 到 IRP 集合 1 和 IRP 集合 2。 假 设 从 IRP 集合 1 中 随机 选择 的 IRPri 
和 ORP1 之 间 的 汉 明 距离 为 sys， 从 IRP 集合 2 中 随机 选择 的 IRPr 和 ORP; 之 间 的 汉 明 距离 为 so» 
那么 (ORP1, ORP;) 和 (IRP1, IRP;) 之 间 的 总 汉 明 距离 为 sitsz。 例如 , ORP: 为 (0,1,1), ORP2 为 (0,10)， 
IRP1 是 (1,1,1), IRP2 是 (1,1,1)， 那 么 (ORP1, ORP2) ( 即 (0,1,1,0,1,0)) 和 (IRP1, IRP2) ( 即 (1,1,1,1,1)) 的 汉 
明 距 离 为 3， 且 等 于 ORP: 和 IRPi1 之 间 的 距离 sı 加 上 ORP: 和 IRP; 之 间 的 距离 sy。 如 图 S1 ATR, 
如 果 IRP 集 1 有 x 个 元 素 ，IRP 集 2 有 m 个 元 素 ， 那 么 最 后 判 准 的 结果 为 某 个 (AMP1, AMP?) 的 概 
率 是 1/xm。 
S1.2 采用 同时 性 计算 策略 的 HDD-T 

在 这 种 情况 下 ， 纵 向 数据 被 作为 一 个 整体 数据 进行 分 析 ，Q 矩阵 的 表示 就 咯 有 不 同 。 假 设 每 
个 时 间 点 的 测试 中 有 5 个 题目 ，3 个 属性 ， 两 个 时 间 点 ， 其 Q 矩阵 可 表示 为 图 S2. Ii D, ... I5 HU FE 
第 一 个 时 间 点 测量 的 题目 ，J D, … 1 是 在 第 二 个 时 间 点 测量 的 题目 。Ki,、Kzj、K31 代表 在 第 一 时 
间 点 测量 的 三 个 属性 ，Ki2、K2?、K3; 代表 在 第 二 时 间 点 测量 的 同样 三 个 属性 。 
图 S3 显示 了 在 纵向 数据 中 使 用 HDD 与 同时 性 计算 策略 的 流程 。 通 过 两 个 时 间 点 ， 可 以 得 到 
2 关 个 属性 向 量 ， 从 而 再 得 到 225 4 IRP。 同 样 ， 可 得 到 一 个 IRP 集合 ， 其 中 的 IRP (ORP, OPR) 
保持 最 小 的 汉 明 距离 。 因 为 汉 明 距离 计算 的 是 两 个 等 长 的 字符 串 之 间 对 应 位 上 不 同 元 素 的 数量 。 
ORP 和 IRP 在 不 同时 间 下 的 汉 明 距离 是 相互 独立 的 。 不 难得 到 IRPr 和 (ORP1，ORP2) 之 间 的 距离 
是 sits SET n ya .yD 和 (ORP1) 之 间 的 距离 加 上 Gp .yD 和 (ORP2) 的 距离 。IRPr 是 从 IRP 
集合 中 随机 选择 的 ， 该 集合 等 于 IRP 集合 1 和 IRP 集合 2 的 所 有 组 合 ( 在 图 S1 中 )( 即 w=xm)。 最 
后 ， 判 准 结果 为 某 个 (AMP1，AMP?) 的 概率 也 是 1/xm。 
S1.3 小 规模 模拟 研究 

为 进一步 研究 HDD-D 和 HDD-T 在 数据 分 析 中 是 否 也 存在 一 致 性 ， 我 们 基于 模拟 研究 3 中 的 
条 件 , 对比 了 HDD-D 和 HDD-T 的 属性 判 准 率 和 计算 耗 时 。 表 S1 呈现 了 HDD-D 和 HDD-T 的 PCCR 
和 LPCCR， 发 现 两 者 之 间 的 差异 很 小 ( 约 0.5%)。 但 两 者 的 计算 耗 时 具有 较 大 差异 ， 当 天 = 3 时 ， 
HDD-D 和 HDD-T 的 平均 计算 耗 时 分 别 为 0.07 秒 和 4.25 秒 ; 745 K—5 8, HDD-D 和 HDD-T 的 平 
均 计 算 耗 时 分 别 为 0.29 秒 和 232.37 秒 〈 超 过 了 Long-DINA 模型 的 174.78 秒 ) 。 表 明 两 者 的 计算 
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时 间 都 受到 属性 数量 的 影响 ， 但 HDD-T 所 受 的 影响 更 大 。 其 主要 原因 在 于 7=3 AIK =5 条 件 下 
HDD-T 中 有 25-32768 种 属性 模式 需要 进行 距离 计算 。 总 之 , 数据 分 析 结 果 表 明 HDD-D 与 HDD-T 


的 属性 判 准 率 几乎 一 样 ， 且 前 者 计算 耗 时 更 少 。 


ORP! : < ORP: 
(€1(1),€2(1),--.521(1)) (a10),820),...,a1(2)) 


比较 其 汉 明 距离 


比较 其 汉 明 距离 


IRP 集合 1 
最 短 汉 明 |_ | 假设 包含 mn 个 IRP 


rat 最 短 汉 明 
假设 包含 m 个 IRP x 4 LH 
ERN (11(2),12(2),---511(2)) 距离 为 sz 


(110),120),.….,110)) 


随机 抽 选 随机 抽 选 
IRPr; IRPr2 
(ORP'1,ORP») 和 (IRPr,IRPr;) 
的 汉 明 距离 为 si s2 


对 应 的 属性 模式 


对 应 的 属性 模式 


判定 为 某 (AMP1, AMP?) 的 概率 为 : 1/nm 


图 SI 独立 计算 策略 HDD-D 示意 图 
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图 S2 同时 性 计算 策略 HDD 的 纵向 Q 矩阵 


2K IRPs (ORP1,ORP2) 


potes 


比较 其 汉 明 距离 


RP 集合 中 的 元 素 为 图 
S1 F IRP 集合 1 和 IRP 
集合 2 中 元 素 的 所 有 排 
IRP 集合 列 组 合 。 即 有 : w= xm 
假设 包含 w^ IRP 


(Ly 2 


IRPr 和 (ORP1.ORP;) 之 间 的 距 
离 是 slts2 ， 其 等 于 
(Ly zY D fI (ORP:1) 85) 2X. B8 
E A 加 上 02D 和 
(ORP2)Z [8] AYR 83 PB B5 


Y 
对 应 的 属性 模式 


判定 为 茶 (AMP1, AMP?) 的 概率 为 : 1/xm 
S3 同时 性 计算 策略 HDD 示意 图 


表 S1 模拟 研究 3 条 件 下 HDD-D 5 HDD-T 的 属性 判 准 率 . 


K HDD 计算 策略 LPCCR 
t=1 t=2 t=3 
3 HDD-D 0.867 0.900 0.937 0.737 
HDD-T 0.870 0.893 0.936 0.731 
5 HDD-D 0.779 0.834 0.876 0.615 
HDD-T 0.784 0.838 0.879 0.619 


